Análise Taxa de Desemprego Alemanha

Nesta seção, são apresentados os resultados da análise da taxa de desemprego mensal na Alemanha, no período de 1994 a 2016. Como os dados estão expressos em porcentagem, foi necessário convertê-los para proporções, dividindo os valores por 100. A série contém um total de 272 observações, obtidas por meio do sistema de gerenciamento de séries temporais do Banco Central do Brasil.

Abaixo temos uma descritiva dos valores da série e também seu Box-plot, podemos notar que não há presença de outliers.

summary(serie_desemprego)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.04300 0.06625 0.08200 0.07887 0.09375 0.11200

A Figura a seguir exibe a série temporal da taxa de desemprego mensal na Alemanha no período de 1994 a 2016. Verifica-se uma tendência de aumento na taxa de desemprego entre 2002 e 2005, atingindo seu pico nesse intervalo. A partir de 2006, observa-se um movimento de queda contínua, o qual se mantém até o término do período analisado, indicando uma possível recuperação sustentada do mercado de trabalho alemão.

Por conseguinte, temos a decomposição da série para tedência e sazonalidade:

A avaliação da estacionariedade da série foi conduzida por meio de testes de raiz unitária, conforme apresentado na Tabela 1. Os testes de Augmented Dickey-Fuller (ADF) e Phillips-Perron (PP) não rejeitaram a hipótese nula de presença de tendência estocástica (p-valores de 0.5579 e 0.9630, respectivamente), sugerindo que a série possui raiz unitária. No entanto, o teste KPSS para nível, cuja hipótese nula é de estacionariedade em torno de uma média constante, foi rejeitado (p-valor = 0.0100), corroborando a evidência de não estacionariedade. Esse conjunto de resultados indica a presença de uma tendência estocástica na série.

A Tabela 2 apresenta os resultados dos testes para identificação de tendência determinística. Todos os testes aplicados (Cox-Stuart, Cox and Stuart Trend, Mann-Kendall, Mann-Kendall Trend e KPSS para tendência) rejeitaram a hipótese nula de ausência de tendência (p-valores ≤ 0.01), indicando de forma consistente a presença de uma tendência determinística ao longo do tempo.

Por fim, a Tabela 3 resume os resultados dos testes de sazonalidade. O teste de Kruskal-Wallis não rejeitou a hipótese nula de ausência de sazonalidade (p-valor = 1.0000), enquanto o teste de Friedman detectou evidência de sazonalidade significativa (p-valor = 0.0181). Assim, embora haja alguma indicação de componente sazonal, os resultados são inconclusivos e sugerem que, se presente, a sazonalidade não é fortemente expressiva.

Tabela 1: Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.5579 Tendencia
Phillips-Perron Unit Root Tendencia 0.9630 Tendencia
KPSS Test for Level NAO tendencia 0.0100 Tendencia
Tabela 2: Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.00 Tendencia
Cox and Stuart Trend NAO tendencia 0.00 Tendencia
Mann-Kendall Trend NAO tendencia 0.00 Tendencia
Mann-Kendall NAO tendencia 0.00 Tendencia
KPSS Test for Trend NAO tendencia 0.01 Tendencia
Tabela 3: Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 1.0000 NAO Sazonal
Friedman rank NAO Sazonal 0.0181 Sazonal

Ajuste do Modelo

Para investigar a presença de dependência de longo prazo na série temporal da taxa de desemprego, estimou-se o expoente de Hurst por diferentes métodos. Conforme apresentado, a estimativa simples baseada no método R/S (rescaled range) resultou em um valor de 0.8373, enquanto a versão corrigida apresentou um valor ainda mais elevado, de 0.9856. Já o expoente de Hurst empírico foi estimado em 0.8267, com a versão corrigida indicando 0.7992. Todos os valores obtidos são significativamente superiores a 0,5, o que evidencia forte persistência temporal na série. Isso implica que choques passados tendem a ter efeitos prolongados ao longo do tempo, o que é característico de processos com memória longa.

Adicionalmente, foi estimado o parâmetro de diferenciação fracionária d , com valor de 1.1003, indicando que a série é fracamente não estacionária e apresenta memória longa, uma vez que \(0.5<d<1.5\). As estimativas do desvio padrão associado, obtidas via aproximação assintótica e via regressão, foram de 0.2102 e 0.1232, respectivamente, reforçando a robustez da estimação de d.

Esses resultados sugerem que, para a modelagem adequada da série, é necessário considerar abordagens que capturem a estrutura de longa dependência, como modelos ARFIMA.

## Simple R/S Hurst estimation:         0.8372923 
## Corrected R over S Hurst exponent:   0.9855974 
## Empirical Hurst exponent:            0.8267286 
## Corrected empirical Hurst exponent:  0.799164 
## Theoretical Hurst exponent:          0.5538539
## $d
## [1] 1.100285
## 
## $sd.as
## [1] 0.2102335
## 
## $sd.reg
## [1] 0.1231577

Por fim, foi considerado um modelo ARFIMA(2, 1, 0), ou seja, dois coeficientes autoregressivos e uma diferenciação. Sendo os valores estimados dos parâmetros significativos, a 5% são: \(\phi_{1}=0.48, \phi_{2}=0.45, \text{fractional differencing}=-0.26\). Além disso temos, \(\text{AIC}=-3775.07, \text{BIC}=-3757.3\). Vale ressaltar que um valor negativo para fractional differencing não é o mais adequado.

Análise de resíduos e Previsão

A Figura apresenta os diagnósticos dos resíduos do modelo ajustado. O gráfico superior exibe a série dos resíduos ao longo do tempo, os quais oscilam em torno de zero sem apresentar padrões sistemáticos visíveis, sugerindo ausência de estrutura temporal remanescente. A análise da função de autocorrelação (ACF), apresentada no gráfico inferior esquerdo, demonstra que os resíduos não apresentam autocorrelação significativa até a defasagem 25, uma vez que a maioria dos coeficientes está contida dentro dos limites de confiança. A normalidade dos resíduos foi avaliada por meio do histograma com sobreposição de uma curva de densidade normal (gráfico inferior direito). A distribuição dos resíduos aproxima-se de uma distribuição normal, com leve assimetria, porém sem evidências visuais de desvios em escala.

Por fim, foi realizado o teste de Ljung-Box para avaliar a independência dos resíduos. O valor do estatístico \(Q∗=9,5962\) com 10 graus de liberdade resultou em um p-valor de 0,4766. Dessa forma, não se rejeita a hipótese nula de ausência de autocorrelação nos resíduos até a defasagem 10, indicando que os resíduos podem ser considerados independentes ao longo do tempo.

forecast::checkresiduals(resid$Mode1)

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 9.5962, df = 10, p-value = 0.4766
## 
## Model df: 0.   Total lags used: 10

Nas imagens abaixo temos acf e pacf dos resíduos do modelo ajustado.

Por fim, a Figura abaixo apresenta os valores preditos para os próximos 12 períodos, com base no modelo ajustado à série temporal. A linha em cinza representa a previsão pontual (Exact prediction), enquanto as faixas tracejadas indicam os intervalos de predição com 95% de confiança. O intervalo tracejado em vermelho corresponde ao intervalo de predição exato (Exact 95% PI), enquanto o intervalo tracejado em laranja refere-se ao intervalo assintótico (Limiting 95% PI), o qual se alarga com o aumento do horizonte de previsão, refletindo o crescimento da incerteza associada às estimativas futuras.

Análise Preço do Ouro

O ouro é um ativo financeiro para exportação, investimentos de longo prazo, consumo industrial e câmbio de moedas estrangeiras. Segundo The Gold Bullion Company, o Brasil ocupa o 7° lugar no balanço mundial de oferta e demanda de ouro, com este contexto foi feito uma análise da série histórica do preço de comercialização diária do ouro(em quilogramas) entre os anos de 2013 a 2023. O Dataset utilizado pode ser acesso neste link do Kaggle Gold Price Prediction. Os dados foram agrupados mensalmente, e ao todo temos 120 observações, o que representaria 120 meses.

summary(serie_gold_price)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1069    1244    1321    1440    1711    1972

A Figura a seguir apresenta a série temporal dos preços mensais do ouro no período de 2013 a 2023. A partir de uma análise visual preliminar, não se observa evidência clara de sazonalidade na série. Destaca-se, entretanto, um aumento expressivo nos preços entre os anos de 2019 e 2021.

Temos também a decomposição da série para tendência e sazonalidade na Figura abaixo:

Conforme os resultados apresentados na Tabela 1, os testes de raiz unitária indicam a presença de uma tendência estocástica na série. Tanto o teste de Augmented Dickey-Fuller (ADF) quanto o teste de Phillips-Perron não rejeitam a hipótese nula de presença de raiz unitária (p-valores de 0.3553 e 0.5252, respectivamente), sugerindo que a série não é estacionária. Por outro lado, o teste KPSS rejeita a hipótese nula de estacionariedade em torno de uma média constante (p-valor = 0.0100), reforçando a conclusão de não estacionariedade e indicando a presença de uma tendência. A Tabela 2 apresenta os resultados dos testes para identificação de tendência determinística. Todos os testes aplicados, incluindo Cox-Stuart, Mann-Kendall e KPSS para tendência, rejeitaram a hipótese nula de ausência de tendência com p-valores inferiores a 0.01. Esse conjunto de evidências confirma a existência de uma tendência determinística significativa ao longo do tempo, o que é compatível com a trajetória ascendente observada na série, especialmente a partir de 2019.

A análise de sazonalidade, sumarizada na Tabela 3, foi conduzida por meio dos testes de Kruskal-Wallis e Friedman rank. Em ambos os casos, os p-valores elevados (0.9991 e 0.8554, respectivamente) indicam que não há evidência estatística para rejeitar a hipótese nula de ausência de sazonalidade. Assim, conclui-se que a série não apresenta comportamento sazonal recorrente. Em conjunto, os resultados apontam que a série é não estacionária, possui uma tendência determinística significativa e não apresenta componentes sazonais, o que deve ser considerado na escolha e especificação de modelos de previsão adequados.

Tabela 1: Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.3553 Tendencia
Phillips-Perron Unit Root Tendencia 0.5252 Tendencia
KPSS Test for Level NAO tendencia 0.0100 Tendencia
Tabela 2: Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.00 Tendencia
Cox and Stuart Trend NAO tendencia 0.00 Tendencia
Mann-Kendall Trend NAO tendencia 0.00 Tendencia
Mann-Kendall NAO tendencia 0.00 Tendencia
KPSS Test for Trend NAO tendencia 0.01 Tendencia
Tabela 3: Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 0.9991 NAO Sazonal
Friedman rank NAO Sazonal 0.8554 NAO Sazonal

Modelo com Redes Neurais

Após a tentativa de ajuste dos modelos clássicos como ARMA, ARIMA e SARIMA, os quais não performaram de maneira adequada, optou-se por desenvolver um modelo de no qual se utiliza séries temporais.

A Tabela 4 apresenta os resultados das métricas de avaliação do modelo ajustado à série temporal de preços mensais do ouro, considerando os conjuntos de treinamento e teste. As métricas utilizadas incluem o erro médio (ME), a raiz do erro quadrático médio (RMSE), o erro absoluto médio (MAE) e o erro percentual absoluto médio (MAPE).

No conjunto de treinamento, o modelo apresentou desempenho satisfatório, com erro médio próximo de zero (ME = -0.0021), o que indica ausência de viés sistemático nas previsões. O RMSE de 38.17 e o MAE de 29.50 indicam que os erros de previsão, em média, são relativamente baixos, considerando a escala dos dados. O MAPE de 2.16% reforça essa avaliação, sinalizando boa acurácia relativa das previsões no período de ajuste.

No entanto, ao se analisar o desempenho no conjunto de teste, observa-se um aumento significativo nos erros. O erro médio passou a 3.23, indicando leve superestimação sistemática. O RMSE e o MAE aumentaram para 86.83 e 73.11, respectivamente, sugerindo maior variabilidade e magnitude dos erros. O MAPE alcançou 4.05%, valor ainda aceitável, mas que indica uma queda na precisão relativa do modelo fora da amostra.

Esses resultados sugerem que, embora o modelo apresente bom ajuste aos dados históricos, seu desempenho preditivo fora da amostra é sensivelmente inferior, o que pode estar relacionado a mudanças estruturais recentes na série ou à presença de eventos atípicos. Assim, a reavaliação da estrutura do modelo, bem como o uso de abordagens mais robustas ou modelos com capacidade adaptativa, pode ser recomendada para melhorar a capacidade preditiva.

Tabela 4: Métricas de Avaliação do Modelo
ME RMSE MAE MAPE
Training set -0.0450483 38.25433 29.53629 2.159379
Test set 3.6810852 86.79897 73.16821 4.054003

A Figura apresenta os diagnósticos dos resíduos do modelo ajustado à série temporal de preços do ouro. O painel superior exibe o gráfico da série residual ao longo do tempo, o qual não indica a presença de padrões sistemáticos ou comportamento estrutural, sugerindo que os resíduos se comportam como ruído branco. A análise da função de autocorrelação dos resíduos (ACF), mostrada no painel inferior esquerdo, demonstra que a maioria dos coeficientes de autocorrelação até a defasagem 36 encontra-se dentro dos limites de confiança de 95% (linhas tracejadas azuis), indicando ausência de autocorrelação significativa nas defasagens avaliadas. O histograma dos resíduos, no painel inferior direito, mostra uma distribuição aproximadamente simétrica em torno de zero, com leve curtose e presença de poucos valores extremos. A curva de densidade ajustada reforça essa proximidade com a distribuição normal, embora pequenas assimetrias possam ser observadas. Adicionalmente, o teste de Ljung-Box foi aplicado para avaliar a hipótese de ausência de autocorrelação nos resíduos até a defasagem 22. O valor do estatístico foi 𝑄∗=17,917, com 22 graus de liberdade e p-valor de 0{,}7109. Como o p-valor é elevado, não se rejeita a hipótese nula de que os resíduos são independentes. Isso reforça a adequação do modelo ajustado, do ponto de vista da estrutura de dependência serial dos resíduos. Em conjunto, os resultados indicam que os resíduos do modelo apresentam comportamento satisfatório, compatível com as suposições de normalidade e ausência de autocorrelação, o que contribui para a validade das inferências e previsões derivadas do modelo.

checkresiduals(fit_netar$residuals)

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 18.609, df = 22, p-value = 0.6694
## 
## Model df: 0.   Total lags used: 22

Por fim, foram gerados os gráficos de previsão que se encontram abaixo.

Referências

Akaike, Hirotogu. 1973. “Information Theory and an Extension of the Maximum Likelihood Principle.” In Selected Papers of Hirotugu Akaike, 199–213. Springer.
Akaike, Hirotugu. 1978. “A Bayesian Analysis of the Minimum AIC Procedure.” In Selected Papers of Hirotugu Akaike, 275–80. Springer.
Box, George EP, Gwilym M Jenkins, Gregory C Reinsel, and Greta M Ljung. 2015. Time Series Analysis: Forecasting and Control. John Wiley & Sons.